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窗 蜂 球 圳 菌 的 参考 转录 组 de novo 组 装 
及 SSR 分 子 标记 开发 
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摘要 :【 目 的) 通过 RNA seq AR] 26222584 E SER E SO apis 孢子 和 球 瞎 菌 侵 染 的 蜜蜂 
幼虫 肠 道 组 织 进行 测序 ,de novo 组 装 球 圳 菌 的 参考 转录 组 ,并 对 其 进行 功能 与 代谢 通路 注释 ,进而 
基于 该 转录 组 数据 开发 球 才 菌 的 SSR 分 子 标记 。【 方法 】 首 先 通 过 差 速 离心 获得 活化 的 球 喜 菌 孢 
Bed) lx 107 孢子 /mL 的 jua 4,5 和 6 H b 83 S X] SEXE Apis mellifera ligustica 幼虫 和 中 
华 蜜蜂 Apis cerana cerana 幼虫 ,通过 Illumina HiSeq'" 2500 4 & A mp x] Eun SEE Sil A £go 
dmg ug vyEGMUR, o 通过 Trinity 软件 组 装 得 到 unigenes ,进而 通过 BLASTX 比 
对 NCBI Nr, Swiss-Prot, KOG 和 KEGG 数据 库 对 unigenes 进行 功能 与 代谢 通路 注释 。 利 用 MISA 
软件 对 所 有 unigenes 进行 SSR 搜索 ,并 利用 Primer Premier 5 软件 设计 SSR 特异 性 引物 ,通过 PCR 
对 不 同 来 源 的 球 党 菌 SSR 位 点 进行 扩 增 。【 结果 】 本 研究 共 获 得 146 135 308 条 高 质量 reads ,de 
novo 组 装 得 到 42 609 个 unigenes。BLASTX 比 对 结果 显示 ,29 316 个 unigenes 在 上 述 公 共 数 据 库 中 
具有 功能 和 代谢 通路 注释 。 注 释 到 法 夫 酵 母 Xanthophyllomyces dendrorhous 上 的 unigenes 最 多 , 达 
6 050 个 。KEGG 注释 结果 显示 ,unigenes 可 注释 到 117 个 代谢 通路 ,其 中 SPEAR ribosome ) 
上 的 unigenes 数量 最 多 (529)。 所 有 unigenes 中 共 预 测 到 7 968 个 SSRs ,通过 PCR 开发 出 5 个 球 
EA SSR 分 子 标记 。【 结论 】 本 研究 成 功 组 装 球 才 菌 的 参考 转录 组 ,并 进行 了 功能 与 代谢 通路 注 
释 , 可 为 在 分 子 水 平 深入 研究 球 过 菌 提供 重要 的 参考 信息 。 基 于 该 转录 组 信 mo» 5 个 SSR 分 
子 标记 可 推动 菌株 鉴定 、 基 因 图 谱 构 建 及 基因 定位 等 研究 。 
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De novo assembly of a reference transcriptome and development of SSR 


markers for Ascosphaera apis 
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Qun^, LIU Min', LI Wen-Dong', TONG Xin-Yu', ZHANG Qi', LIANG Qin', GUO Rui^* , CHEN 
Da-Fu"* (1. College of Bee Science, Fujian Agriculture and Forestry University, Fuzhou 350002, 
China; 2. Apiculture Institute of Jiangxi Province, Nanchang 330201 , China) 

Abstract: [ Aim] This study aims to deeply sequence the purified spores of Ascosphaera apis and 
honeybee larval gut infected with A. apis using RNA seq technology, to de novo assemble a reference 
transcriptome of 4. apis, to further conduct functional and metabolic pathway annotation, and finally to 


develop SSR markers for A. apis. [Methods] A. apis spores purified after differential centrifugation were 
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fed to the 4-, 5- and 6-day-old larvae of Apis mellifera ligustica and A. cerana cerana at a concentration of 
1 x 10! spore/mL. The purified spores of A. apis and the infected honeybee larval guts were sequenced at 
Illumina HiSeq™ 2500 platform. After filtration of raw reads, unigenes were de novo assembled with 
Trinity software and annotated through BLASTX against the NCBI Nr, Swiss-Prot, KOG and KEGG 
databases. The MISA software was used to search SSRs in all unigenes, and Primer Premier 5 software 
was used to design specific primers for SSR loci. PCR was carried out to amplify SSR loci in A. apis from 
different regions in China. [Results] In this study, a total of 146 135 308 high-quality reads were 
produced from RNA seq, and 42 609 unigenes were de novo assembled. BLASTX results indicated that 
29 316 unigenes have function or metabolic pathway annotations in the aforementioned public databases. 
And the most unigenes (6 050) were annotated to Xanthophyllomyces dendrorhous. The results of KEGG 
pathway annotation revealed that all unigenes were annotated to 117 metabolic pathways, among which 
ribosome (529 unigenes) was the most enriched one. In total, 7 968 SSRs were predicted from all 
unigenes, and five SSR markers were developed by PCR amplification. [ Conclusion] In this study, a 
reference transcriptome of A. apis was successfully de novo assembled and annotated, providing significant 
information for further studying A. apis at the molecular level. Five SSRs developed in this study can 
facilitate the research on A. apis including strain identification, gene map construction and gene 
localization. 


Key words: Ascosphaera apis; reference transcriptome; RNA seq; function and metabolic pathway 


annotation; SSR 





蜜蜂 白 亚 病 (chalkbrood disease) 是 一 种 最 具 代 
表 性 的 蜜蜂 真菌 病 ,1913 年 Massen 在 德国 首次 报 
道 白垩 病 ,中 国 大 陆 1990 年 发 生 白垩 病 ( 深 勤 和 陈 
大 福 , 2009) ,近年 来 , 随 着 蜂 产 品 贸易 的 快速 发 展 ， 
白 亚 病 呈 逐年 上 升 的 趋势 (Aizen et al., 2009) 。 该 
Jii ks E EERIE Ascosphaera apis 特异 性 侵 染 蜜蜂 
幼虫 而 导致 ,发 病 时 期 一 般 为 春季 和 初夏 ,虽然 不 对 
蜂 群 造成 毁灭 性 打击 ,但 却 能 造成 成 年 蜜蜂 数量 的 
大 幅 下 降 , 从 而 严重 影响 蜂蜜 等 产品 的 产量 ( Bailey 
and Ball, 1991; Wood, 1998) 。 据 报道 ,白垩 病 可 造 
成 蜂蜜 产量 下 降 5% ~37% (Zaghloul et al., 2005) 。 
近 几 十 年 ,人 们 从 形态 学 (Spiltoir，1955; Skou, 
1988; Anderson and Gibson, 1998 )、 培 养 方法 
( Anderson and Gibson, 1998; Laf, 2015) .流行 病 学 
(Flores et al., 2005a, 2005b) , 5278 75 3X ( Póggeler, 
2001; Chorbiüski, 2003) | jj LEE ( Bailey and Ball, 
1991; Theantana and Chantawannakul, 2008), fü 3E 
Bii] ( Stanley et al., 2009; Evans and Spivak, 2010) 
及 防治 策略 ( Hornitzky, 2001; Tarpy, 2002; Mourad 
et al., 2005) 等 方面 对 白垩 病 进行 了 较 多 研究 并 取 
得 一 些 重要 进展 。 然 而 ,目前 尚 无 一 种 抗 真 菌 药 物 
被 批准 用 于 养 蜂 生 产 ,一 些 替 代 的 防治 方法 ,如 饲养 
管理 ( Anderson et al., 1997 ; Baggio et al., 2005) 等 ， 
虽 取 得 一 定 效 果 , 但 总 体 并 不 理想 。 

本 课题 组 也 对 球 喜 菌 病原 检测 等 方面 进行 了 一 














































































































系列 研究 ,如 李江 红 等 (2012 ) 给 人 工 饲养 的 意大利 
蜜蜂 Apis mellifera ligustica (简称 意 蜂 ) 幼虫 接种 球 
EAMT ,发现 28Y 低温 处 理 能 够 显 若 提 高 处 于 幼 
虫 到 师 转 化 期 蜜蜂 的 发 病 率 , 摄 人 的 孢子 在 整个 幼 
虫 期 因 中 肠 没 有 氧气 而 不 生长 ,幼虫 的 取 食 和 发 育 
过 程 正常 ,至 幼虫 期 结束 进入 肾 期 后 ,蜜蜂 的 中 后 肠 
接 通 , 摄 入 的 孢子 伴随 蜜蜂 的 肾 便 进入 后 肠 并 在 此 
迅速 萌发 生长 ,! ~2 d 内 菌 丝 即 突 破 体 表 而 导致 蜜 
蜂 死 亡 ; 郑 志 阳 等 (2011 ) 对 健康 和 患 病 蜜蜂 幼虫 血 
淋巴 进行 SDS-PAGE 电泳 和 和 蛋白酶 . 酯 酶 的 活性 染 
色 ,发 现 健康 蜜蜂 幼虫 血 淋 巴 中 的 蛋白 含量 丰富 , 主 
要 由 4 种 高 分 子 质 量 的 蛋白 组 成 , 而 患 病 幼 虫 血 淋 
巴 中 的 蛋白 含量 很 少 , 主要 蛋白 组 分 被 降解 。 由 于 
基因 组 信息 的 缺失 ,球面 菌 在 分 子 水 平 的 研究 近乎 
fi. Qin 等 (2006 ) xii T ERAT ARSEF7406 
株 的 基因 组 序列 , HERRERA TIAE T AER, 
但 作者 并 没有 公布 基因 的 位 置 和 功能 注释 信息 。 
Cornman 等 (2012 ) 利用 Roche 454 焦 磷酸 测序 技术 
对 来 自 培养 基 的 球 训 菌 菌 丝 和 来 自 蜜蜂 幼虫 感染 组 
织 的 球 圳 菌 菌 丝 进行 了 转录 组 测序 ,功能 分 析 表 明 
球 喜 菌 的 差异 表达 基因 参与 了 交配 类 型 细胞 内 信 
号 转 导 和 应 激 反应 。 

鉴于 目前 球 吉 菌 参考 基因 组 位 置 及 功能 注释 信 
息 缺 失 的 现实 ,本 研究 利用 RNA seq 技术 对 纯 培 养 
的 球 吉 菌 孢子 进行 深度 测序 ,同时 对 球 宫 菌 胁迫 的 
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意 蜂 幼虫 及 中 华 蜜蜂 Apis cerana cerana ( 简称 中 蜂 ) 
幼虫 肠 道 组 织 进行 测序 ,通过 比 对 意 蜂 的 参考 基因 
组 和 中 蜂 幼 虫 肠 道 的 参考 转录 组 过 滤 掉 蜜蜂 幼虫 肠 
道 组 织 的 测序 数据 ,将 过 滤 后 的 测序 数据 与 球 早 菌 
孢子 的 测序 数据 混合 ,进而 de novo HR ERIE H BY 
unigenes ,并 对 其 进行 功能 注释 与 代谢 通路 注释 。 利 
用 本 研究 组 装 得 到 的 球 者 菌 参 考 转 录 组 ,可 对 纯 培 
养 的 球 圳 菌 与 感染 肠 道 内 的 球 寺 菌 进行 差异 表达 基 
因 分 析 ,进而 通过 转录 组 水 平 的 深入 分 析 揭 示 球 吉 
菌 胁迫 过 程 中 的 病原 -宿主 互 作 。 本 研究 将 为 球 洁 
的 分 子 研 究 提 供 重要 的 参考 信息 ,基于 该 参考 转 
组 信息 开发 出 的 5 个 SSR 分 子 标记 ,可 用 于 球赛 
菌株 鉴定 、 基 因 图 谱 构 建 及 遗传 多 样 性 等 研究 。 












































BE XU BE 





1 材料 与 方法 


1.1 供 试 密 蜂 与 球 圳 菌 

本 研究 使 用 的 意 蜂 幼虫 和 中 蜂 幼 虫 取 自 福建 农 
林 大 学 蜂 学 学 院 教学 蜂 场 ,蜜蜂 球 喜 菌 菌 株 由 福建 
农林 大 学 蜂 学 学 院 蜜蜂 保护 实验 室 保 存 并 活化 。 
1.2 主要 实验 试剂 及 仪器 

DEPC 水 购 自 生 工 生物 工程 (上 海 ) 有 限 公 
司 ,DNasel 和 Oligotex mRNA Kits Midi 试剂 盒 购 自 
德 Qiagen 公司 , Dynal M280 磁 珠 购 自 美 
Invitrogen 公司 ,高 碘 酸 钠 购 自 美 国 Sigma 公司 ,DNA 
Ligase 购 自 美国 Thermo 公司 ,RNAiso Reagent 抽 提 
AWA Ex Taq Polymerase 及 Superscript I| Reverse 
Transcriptase 均 购 自 日 本 TaKaRa 公司 ,纯化 cDNA 
的 Agencourt AMPure XPbeads 购 自 Beckman 美国 公 
HJ, cDNA 文库 构建 试剂 盒 TruSeq™ DNA. Sample 
Prep Kit v2-Set A 购 自 美 Illumina 公司 , DNA 
marker 为 日 本 TaKaRa 公司 产品 。 其 他 试剂 均 为 
产 分 析 纯 。 

桓温 恒温 气 伐 箱 购 自 中 国 宁波 江南 仪 问 厂 ,pH 
酸度 计 购 自 中 国 上 海 仪 电 科学 股份 有 限 公 司 , 超 纯 
水 仪 购 自 中 国 四 川 沃 特 尔 水 处 理 设备 有 限 公 司 ,高 
速 冷冻 离心 机 购 自 德国 Eppendorf 公司 ,倒置 显微镜 
购 自 中 国 上 海光 学 仪器 五 厂 , 超 净 工 作 台 购 自 中 国 





































































































(2009) 的 研究 报道 。7 日 龄 两 种 蜜蜂 幼虫 的 成 活 率 
可 达 70% 和 90% 以 上 。 将 2 日 龄 幼虫 移 至 24 FLI 
培养 板 , 置 于 恒温 恒 湿 培养 箱 ,35%C ,70% 相对 湿度 
(RH) 条 件 下 饲养 ,每 24 h 更 换 饲 料 。3 日 龄 时 ,一 
组 幼虫 饲 喂 含 球 吾 菌 孢 子 的 人 工 饲料 (孢子 浓度 为 
1 x10 孢子 /mL) , 另 一 组 饲 喂 正常 人 工 饲料 。 上 述 
两 组 均 设 3 个 生物 学 重复 。 
1.4 测序 样品 的 准备 

从 接 菌 活化 的 平板 上 刊 取 球 法 菌 抱 子 至 EP 管 
中 ,按照 Jensen 等 (2013 ) AIDIA HEIT Abe ERE 
子 , 液 氮 速 冻 后 迅速 转移 至 超低温 冰箱 保存 备用 。 
分 别 训 取 上 述 球 圳 苗 侵 染 的 意 蜂 幼虫 4, 5 和 6 日 
龄 ) 肠 道 与 中 蜂 幼 虫 (4, 5 和 6 日 龄 ) 肠 道 , 液 氮 速 
冻 后 迅速 转移 至 超低温 冰箱 保存 备用 。 
1.5 cDNA 文库 构建 及 RNA seq 测序 

首先 提取 上 述 各 球 圳 菌 侵 染 肠 道 样品 与 球赛 菌 
纯化 孢子 样品 总 RNA ,用 带 有 Oligo( dT) 的 磁 珠 富 
集 真 核 生 物 mRNA。 加 入 fragmentation buffer 将 
mRNA 打 断 成 短片 段 , 以 mRNA 为 模板 ,用 六 碱 基 
随机 引物 (random hexamers) 合成 cDNA 第 1 链 , 然 
IAZ pi dNTPs RNase H 和 DNA polymerase I 
合成 cDNA 第 2 链 , 在 经 过 QiaQuick PCR 试剂 盒 纯 
化 并 加 EB 缓冲 液 洗 脱 之 后 做 未 端 修复 .加 poly (A) 
并 连接 测序 接头 ,然后 用 琢 脂 糖 凝 胶 电 泳 进行 片段 
大 小 选择 , 最 后 进行 PCR 扩 增 , 建 好 的 测序 文库 用 
Illumina HiSeq™ 2500 进行 测序 。 
1.6 球 圳 菌 参考 转录 组 的 de novo 组 装 

对 于 球 圳 菌 侵 染 意 蜂 、 中 蜂 幼 忠 肠 道 样 品 的 测 
序数 据 , 首先 分 别 比 对 意 蜂 参考 基因 组 ( assembly 
Amel, 4. 5, assembly ACSNU-2.0) 和 中 蜂 幼 虫 肠 道 
参考 转录 组 (本 课题 组 组 装 , 原始 数据 已 上 传 NCBI 
SRA 数据 库 ,SRA Num: SRA456721 ) , 将 未 比 对 上 
的 数据 与 纯化 球 喜 菌 孢 子 测 序数 据 混 合 。 利 用 Perl 
脚本 去 除 上 述 混合 数据 中 含有 adaptor, N 的 比例 大 
于 10% 的 和 低 质量 读 段 (reads ) , 获得 有 效 读 段 
(clean reads )。 利 用 软件 Trinity f fT Ek 3€ 
unigenes 的 de novo 组 装 ( 缺 省 值 Kmer 225) 。 长 度 
短语 200 bp 的 contigs 和 unigene 将 被 舍弃 。 过 滤 和 

























































































苏州 安泰 空气 技术 有 限 公司 ,PCR 仪 购 自 美国 Bio 
Rad 公司 , 凝 胶 成 像 仪 购 自 中 国 上 海 培 清 科 技 有 限 
公司 ,超低温 冰箱 购 自 中 国 中 科 美 莹 低温 科技 股份 
有 限 公司 。 
1.3 密 蜂 幼虫 饲养 及 球 宫 菌 侵 染 

意 蜂 幼虫 及 中 蜂 幼 虫 饲料 配方 参照 王 倩 等 

















组 装 以 后 得 到 高 质量 的 unigene。RNA sed 原始 数据 
已 上 传 NCBI SRA 数据 库 ,SRA Num: SRA464366, 
1.7 Unigenes 基本 功能 注释 

利用 BLASTX(E-value <10“) 将 测序 序列 比 对 
NCBI Nr, Swiss-Prot, KOG 和 KEGG 数据 库 。 通 过 
BLASTX 将 组 装 出 来 的 unigenes 序列 与 Nr 数据 库 
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进行 比 对 后 , 取 每 个 unigene 在 Nr 库 中 比 对 结果 最 
好 (E 值 最 低 ) 的 那 一 条 序列 为 对 应 同 源 序列 (如 有 
并 列 , 取 第 一 条 ) 确 定 同 源 序列 所 属 物 种 ,统计 比 对 
到 各 个 物种 的 同 源 序列 数量 。 基 于 Nr 数据 库 注释 
结果 ,利用 Blast2GO 进行 unigenes 的 GO 注释 ,利用 
WEGO 软件 进行 GO 分 类 。 

通过 BLASTX (E-value < 10 一 程序 将 unigenes 
序列 比 对 至 Nr, KOG, KEGG 和 Swiss-Prot 蛋白 数 
据 库 ,最 佳 比 对 结果 将 用 于 确定 unigenes 的 方向 。 
如 果 不 同 库 之 间 的 比 对 结果 有 了 矛盾 , 则 按 Nr, Swiss- 
Prot, KEGG 和 KOG 的 优先 级 确定 unigenes 的 序列 
方向 。 若 某 一 转录 本 无 法 比 对 到 上 述 数 据 库 ,利用 
ESTscan 预测 unigenes 的 编码 区 及 确定 序列 方向 。 
1.8 SSR 分 子 标记 开发 

利用 软件 MISA 搜索 unigenes 的 微 卫星 标记 ， 
按照 以 下 标准 从 unigenes 中 查找 SSR 位 点 :二 核 背 
酸 重 复 =6 次 ,三 核 苷 酸 重复 =>5 次 ,四 核 苷 酸 重复 
三 5 次 ,五 核 苷 酸 重复 >=5 次 和 六 核 音 酸 重 复 =>5 次 ， 
同时 分 析 SSR 的 基 元 类 型 的 特征 。 根 据 MISA 的 输 
出 结果 ,利用 Primer Premier 5 (Premier 公司 ,加 拿 
大 ) 对 每 一 个 含有 16 bp 碱 基 重 复 的 SSR 设计 引物 。 

选取 来 源 于 福建 福州 (FZ) 和 浙江 苍山 (CS ) 的 
球面 菌 样本 进行 SSR 位 点 鉴定 ,首先 利用 真菌 RNA 
抽 提 试剂 盒 RNAiso Reagent( TaKaRa 公司 ,日 本 ) 抽 
JERR E A ET RNA, 然后 利用 反 转 录 试 剂 盒 


Superscript [| Reverse Transcriptase ( TaKaRa 公司 ， 


















































日 本 ) 进行 反 转 录 得 到 cDNA ,随机 选择 20 对 SSR 
特异 性 引物 进行 PCR $35, PCR 反应 体系 为 20 
pL: cDNA 模板 1 uL, Mixture 10 uL, 上 和 下游 引物 
(10 phmolL) 各 1 AL, 无 菌 水 补 至 20 iL; PCR 程序 : 
94'C 预 变 性 5 min; 94% 变性 50 s,55% 退火 30 s, 
72*C 延伸 30 s, 共 33 个 循环 ;最 后 72% 延伸 10 min, 
PCR 产物 经 1% Xy BESSER: FL DICES: DU o 











2 结果 


2.1 RNA seq 数据 分 析 及 unigenes 组 装 

R3 vi Ati (5191 17 5 ERE VIE 3 8908 27] HJ E H 
ZH Illumina 测序 , 共 获 得 151 312 584 条 原始 读 段 
(raw reads) ,去 除 含 adapter 的 、 含 N 比例 大 于 10% 
的 和 低 质 量 的 reads, 共 得 到 146 135 308 条 clean 
reads, 各 样品 clean reads 数 均 在 27141980 
(94. 37% ) 以 上 , 两 端 Q20 ( 9996 碱 基 正 确 率 ) 均 在 
3 292 721 137 (97.05% ) 以 上 ,说 明 RNA seq 数据 
质量 良好 ( 表 1)。 

将 clean reads ZEE JJ EARE ( contigs ) 进一步 对 
contigs 序列 拼接 和 去 宛 余 处 理 分 别 得 到 42 609 个 
unigenes( 表 2) ,平均 长 度 为 966 nt, N50 为 1 550 nt 
(图 1) ,说 明 本 研究 unigenes 的 组 装 质量 较 好 。 经 
统计 ,unigene 的 数目 随 着 序列 长 度 的 增加 而 减少 ， 
在 300 ~399 nt 长 度 范围 内 数目 最 多 ,符合 生物 体 序 
列 长 度 分 布 的 基本 规律 。 
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Fig. 1 


图 1 EZK3ÉP unigenes 长 度 分布 医 


Length distribution of unigenes of Ascosphaera apis 
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表 1 RNA seq 数据 统计 
Table 1 Summary of RNA seq data in this research 
样本 d reads 数目 过 滤 后 reads BH (HAE) oe 百分比 接头 数 ( 百分比 ) ” 低 质 量 reads 数 ( 百分比 ) 020 百分比 
Sample umber ol reads Nomber of reads after GC Pease Number of Number of low-quality (30 Dareenlape 
before filtration filtration (percentage) adapters (percentage) reads (percentage) 
AaCK-1 27 346 616 258 80 356 (94. 6496 ) 52.87 121 010 (0. 4496 ) 1 341 932 (4.9196) 97.11 
AaCK-2 28 762 462 27 141 980 (94. 3796 ) 55.38 142 288 (0. 50% ) 1 474 808 (5. 1396) 97. 05 
AaCK-3 28 615 498 27 069 220 (94. 6% ) 55.41 124 140 (0. 4496 ) 1 418 572 (4.9696) 97.15 
AamT1-1 2 528 840 2 469 622 (97.6696) 41. 94 6 528 (0.2696) 52 690 (2.0896 ) 97.45 
AamTI-2 2 737 168 2 693 106 (98. 39% ) 43. 02 5 668 (0.2196) 38 394 (1. 4096 ) 97. 85 
AamT1-3 3 023 132 2 980 240 (98. 5896 ) 43. 25 5 532 (0. 1896 ) 37 360 (1.2496 ) 98. 18 
AamT2-1 3 178 228 3 122 140 (98. 2496 ) 42. 28 6 568 (0.2096) 49 520 (1.5696) 97.99 
AamT2-2 2 547 204 2 501 890 (98. 22% ) 43. 29 5 928 (0.2396) 39 386 (1.5596) 97.75 
AamT2-3 2 814 364 2 768 034 (98.35% ) 42. 33 5 510 (0. 2096 ) 40 820 (1. 4596 ) 98. 07 
AamT3-1 3 229 530 3 178 978 (98.4396) 44. 91 6 086 (0. 19% ) 44 466 (1.38% ) 97. 89 
AamT3-2 2 345 336 2 253 412 (96. 08% ) 42.95 7 566 (0.33% ) 84 358 (3. 60% ) 97. 08 
AamT3-3 3 050 274 2 942 398 (96. 46% ) 43. 12 7 862 (0.2696) 100 014 (3.2896 ) 97.19 
AacTI-1 2 799 036 2 799 036 (10096 ) 42. 56 0 (096) 0 (096) 97. 14 
AacT1-2 3 196 972 3 196 972 (100% ) 42. 02 0 (096) 0 (096) 97.29 
AacTI-3 3 189 982 3 189 982 (10096) 41. 85 0 (096) 0 (096) 97. 08 
AacT2-1 4 146 604 4 146 604 (100% ) 43. 28 0 (096) 0 (0%) 98. 01 
AacT2-2 3 424 686 3 424 686 (100% ) 44. 86 0 (096) 0 (0%) 97. 72 
AacT2-3 3 653 650 3 653 650 (10096) 45. 28 0 (096) 0 (096) 97.91 
AacT3-1 9 455 236 9 455 236 (10096) 49. 38 0 (096) 0 (0%) 98. 02 
AacT3-2 4 398 766 4 398 766 (100% ) 45. 82 0 (096) 0 (096) 97. 70 
AacT3-3 6 869 000 6 869 000 (10096) 47.18 0 (096) 0 (096) 97.95 
表 2 Unigenes 组 装 结果 统计 表 
Table 2 Summary of de novo assembly of unigenes 
基因 数目 GC 百分比 N50 数值 最 大 长 度 (nt) 最 小 长 度 (nt) 平均 长 度 (nt) 总 碱 基数 
Gene number GC percentage N50 Maximum length Minimum length Average length Total number of assembled bases 
42 609 50. 0160 1 550 12 740 179 966 41 192 931 


2.2 Unigenes 注释 

利用 BLASTX(E-value < 10 ^?) Xf unigenes 序列 
比 对 NCBI Nr, Swiss-Prot, KOG 和 KEGG 数据 库 ， 
比 对 结果 显示 分 别 有 24 027, 24 311, 20 931 和 12 

















983 个 unigenes 能 够 注释 到 上 述 公 共和 蛋白 数据 库 ， 
有 功能 注释 的 unigenes 数目 为 29 316, 占 全 部 
unigenes 的 68. 896 ;此 外 ,有 31. 1996 的 unigenes 无 
功能 注释 ( 表 3) 。 





RI 四 大 蛋白 数据 库 中 unigenes 的 注释 统计 


Table3 Summary of annotation information of all unigenes in four public protein database 























通用 基因 注释 基因 注释 基因 
ane Nr Swiss-Prot KOG KEGG 注释 基因 未 注释 基 
Total unigenes Annotated genes Unannotated genes 
42 610 24 027 24 311 20 931 12 983 29 316 13 294 








注释 到 Nr 数据 库 中 unigenes H E-value 分 布 显 
示 ( 图 2), 比 对 到 物种 序列 的 E-value 均 小 于 1E - 
5, 其 中 下 -value 小 于 1E -100 的 有 43.27% ,说 明 注 
释 结果 可 信和 度 较 高 。 注 释 基 因 同 源 序列 的 物种 分 布 




















统计 结果 显示 ,注释 基因 数 最 多 的 物种 是 法 夫 酵 母 
Xanthophyllomyces | dendrorhous, 其 次 是 白 伪 
Beauveria bassiana D1-5 PI dX A! 3k Si Lichtheimia 
corymbifera JMRC : FSU :9682) (3&4), 
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11.22% 





Bl 16-20 < evalue <= 1E-5 : 5707 
I 1E-50 < evalue <= 1E-20 : 5757 
Bl 1E-100 < evalue <= 1E-50 : 4870 
Wl 1 E-150 < evalue <= 1E-100 : 2697 
Bi 0 <= evalue <= 1E-150 : 4996 


C 9.97% 


3213% 





Wi 1E-20 < evalue <= 1E-5 : 4845 

13 1E-50 < evalue <= 1E-20 : 6726 
Bi (E-100 < evalue <= 1E-50 : 5176 
Wi 1E-150 < evalue <= 1E-100 : 2098 
B 0 <= evalue <= 1E-150 : 2086 


B 


10.52% 


10.26% 


25.62% 





30.13% 


Wi 1E-20 < evalue <= 1E-5 : 5706 
I3 1E-50 < evalue <= 1E-20 : 7324 
B 16-100 < evalue <= 1E-50 : 6229 
Wl 1E-150 < evalue <= 1E-100 : 2494 
B 0 <= evalue <= 1E-150 : 2558 


11.77% 
23.39% 





20.97% 


Ii 1E-20 < evalue <= 1E-5 : 2587 

I 1E-50 < evalue <= 1E-20 : 3037 
Bi 1E-100 < evalue <= 1E-50 : 2723 
Wi 1E-150 < evalue <= 1E-100 : 1528 
B 0 <= evalue <= 1E-150 : 3108 


图 2 Nr (A), Swiss-Prot (B), KOG (C) fl KEGG (D) 数 据 库 中 unigenes 的 下 值 分 布 
Fig. 2 Distribution of E-value of unigenes in databases Nr ( A) , Swiss-Prot (B), KOG (C) and KEGG (D) 


5&4  Unigenes 在 各 物种 分 布 统计 表 


Table 4 Distribution of unigenes in different species 


基因 数目 

















Number of unigenes 
法 夫 酵母 Xanthophyllomyces dendrorhous 6 050 
ERHET Beauveria bassiana D1-5 745 
MARRIT Lichtheimia corymbifera JMRC:FSU:9682 649 
毛 霉菌 Mucor ambiguus 542 
WRATH Rhizophagus irregularis DAOM 197198w 535 
球 孢 子 菌 Coccidioides immitis RS 422 
效 壶 菌 Rozella allomycis CSF55 403 
副 球 孢 子 菌 Paracoccidioides sp. "lutzii' Pb01 397 
皮炎 芽 生 菌 Blastomyces dermatitidis SLH14081 385 
青 霉 菌 Penicillium rubens Wisconsin 54-1255 330 





2.3 Unigenes 的 Gene Ontology( GO) 分 类 
利用 WEGO 软件 对 可 注释 到 GO 数据 库 的 
unigenes 进行 分 类 ,结果 显示 这 些 unigenes 主要 分 


为 生物 学 进程 细胞 组 分 和 分 子 组 分 3 个 大 类 ,共同 
富 集 在 40 个 GO term 上 (图 3) ,基因 富 集 数 最 多 的 
前 十 个 GO term 分 别 为 细胞 进程 (cellular process) , 
代谢 过 程 (metabolic process ) , f£ 4E 1 2] ( catalytic 
activity) 、 细 胞 整体 ( cell) 、 细 胞 部 分 ( cell part) 、 结 合 
活性 (binding activity )、 单 有 机 体 过 程 ( single- 
细胞 器 (organelle )、 定 位 
(localization) 以 及 大 分 子 复 合 物 (macromolecular 
complex)( 表 5) 。 
2.4 Unigenes 的 KEGG 代谢 通路 注释 

对 所 有 unigenes 进行 KEGG 代谢 通路 富 集 分 
析 ， dd 7 694 个 unigenes 注释 到 KEGG 数据 
库 中 (图 4)。 这 些 unigenes 分 布 于 117 个 已 知 的 代 
谢 通路 中 ,其 中 基因 富 集 数 最 多 的 10 个 代谢 通路 分 
别 为 核糖 体 ( ribosome ) 、 氨 基 酸 生物 合成 


organism process ) 、 
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Biological process Cellular component Molecular function 


3 全 部 unigenes 的 GO 分 类 


Fig. 3 GO classification of all unigenes 


KEGG pathway annotation 


新 陈 代谢 Metabolism 

碳水 化 合 物 代谢 Carbohydrate metabolism || 974 

新 陈 代谢 总 览 Global and overview || 798 

氨基 酸 代 谢 Amino acid metabolism || 789 

能 量 代谢 Energy metabolism | 530 

脂 代谢 Lipid metabolism || 489 

核 苷 酸 代谢 Nucleotide metabolism ||" 427 

辅 因 子 与 维生素 代谢 Metabolism of cofactors and vitamins B 402 
其 他 氨基 酸 代 谢 Metabolism of other amino acids || 245 

多 糖 生 物 合成 与 代谢 Glycan biosynthesis and metabolism || 237 
芒 类 化 合 物 与 聚 酮 化 合 物 代谢 Terpenoids and polyketides metabolism |E 77 
其 他 次 生 代 谢 产物 生物 合成 Biosynthesis of other secondary metabolites 目 37 
遗传 信息 加 工 Genetic information processing 

译 Translation | 1:343 

折 受 、 分 类 与 降解 Folding, sorting and degradation | 和 | 灶 c 吧 1060 

转录 Transcription EE 553 

复制 与 修复 Replication and repair ME 322 

环境 信息 加 工 Environmental information processing 

信号 转 导 Signal transduction | WW 196 

膜 转运 Membrane transport |I 43 

细胞 进程 Cellular processes 

转运 与 代谢 Transport and metabolism ME 883 

细胞 生长 与 死亡 Cell growth and death | 319 

有 机 体系 统 Organismal systems 

衰老 Aging|115 

人 类 疾病 Human diseases 

内 分 泌 与 代谢 疾病 Endoctrine and metabolic diseases| 109 

抗 药性 Drug resistance| 2 




















) 269 538 807 1076 1345 


图 4 全 部 unigenes 的 KEGG 代谢 通路 注释 结果 


Fig. 4 KEGG metabolic pathway annotation of all unigenes 
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*5 基因 富 集 数 前 10 位 的 GO term 
Table 5 Top 10 GO classification of unigenes 























分 类 Class 数目 Number 
细胞 进程 Cellular process 6 729 
新 陈 代 谢 Metabolic process 6 686 
催化 活动 Catalytic activity 6 543 
细胞 整体 Cell 6 167 
细胞 部 分 Cell part 6 167 
结合 活性 Binding activity 5 332 
单 有 机 体 过 程 Single-organism process 5 195 
细胞 器 Organelle 3 850 
定位 Localization 2 065 
大 分 子 复 合 物 Macromolecular complex 2 057 


(biosynthesis of amino acids )、 碳 代谢 (carbon 
metabolism) 内 质 网 蛋白 加 工 ( protein. processing in 
endoplasmic reticulum ) .剪接 体 (spliceosome) , RNA 
转运 (RNA transport ) ,. IS m [UC jjj ( purine 
metabolism ) , [^j fr ( endocytosis )、 氧 化 磷酸 化 
(oxidative phosphorylation ) 和 谤 素 介 导 的 蛋白 水 解 
(ubiquitin mediated proteolysis) ( 3€ 6) 。 
2.5 SSR 分 子 标 记 开 发 

利用 MISA 软件 对 所 有 unigenes 进行 搜索 , 共 
预测 出 7 968 个 SSR 位 点 , 其 中 三 核 甘 酸 (tri- 
nucleotide ) 重复 最 多 ,数目 达到 4 235 ,其 次 是 二 核 
EE2( di-nucleotide, 2 575) ( 表 7)。SSR 基 元 分 析 
结果 显示 , AG/CT 的 出 现 频率 最 高 ,其 次 是 AT/AT 
和 AGCACTG( 图 5)。 























表 6 基因 富 集 数 最 多 的 前 10 个 KEGG 代谢 通路 
Table6 Top 10 metabolic pathway enrichment of unigenes in KEGG database 






























































代谢 通路 基因 富 集 数 代谢 通路 号 
Metabolic pathway All genes with pathway annotation Pathway ID 
核糖 体 Ribosome 529 ko03010 
氨基 酸 生 物 合成 Biosynthesis of amino acids 459 ko01230 
碳 代谢 Carbon metabolism 452 ko01200 
内 质 网 蛋白 质 加 工 Protein processing in endoplasmic reticulum 421 ko04141 
剪接 体 Spliceosome 407 ko03040 
RNA 转运 RNA transport 388 ko03013 
味 叭 代谢 Purine metabolism 379 ko00230 
内 春 Endocytosis 351 ko04144 
氧化 磷酸 化 Oxidative phosphorylation 343 ko00190 
泛 素 介 导 蛋白 水 解 Ubiquitin mediated proteolysis 283 ko04120 
表 7 AH SSR 位 点 统计 
Table7 Statistics of SSRs of Ascosphaera apis 
统计 项 目 Statistics item 数目 Number 
检测 序列 总 数 Total number of sequences examined 42 610 
检测 序列 总 长 度 (bp)Total size of examined sequences 41 192 931 
鉴定 出 的 SSR 总 数 Total number of identified SSRs 7 968 
包含 SSR 的 序列 总 数 Number of SSR containing sequences 5 233 
含 1 个 以 上 SSR 的 序列 总 数 Number of sequences containing more than one SSR 1 615 
化 合 物 形成 过 程 中 的 SSR 总 数 Number of SSRs present in compound formation 1012 
ZZR Di-nucleotide 2 575 
=E Tri-nucleotide 4 235 
VU tr Eg Tetra-nucleotide 674 
TAZE Penta-nucleotide 264 
NIZ R Hexa-nucleotide 220 





随机 选择 20 对 特异 性 引物 ,对 来 源 于 福州 和 苍 
山 的 球 圳 菌 样 本 进行 PCR 扩 增 。PCR 产物 经 1% 
琼脂 糖 凝 胶 电 泳 检测 ,结果 显示 ,共有 5 对 引物 ( 表 




















km 





8) 可 在 不 同 来 源 球赛 菌 样品 中 二 者 都 扩 增 出 符合 
预期 的 特异 性 片段 (图 6) ,说 明 这 些 鉴 定 出 的 SSR 
位 点 可 作为 球 宫 菌 特有 的 分 子 标记 。 
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图 5 不 同 串联 重复 单元 类 型 的 SSR 在 总 SSR 中 所 占 比例 统计 
Fig. 5 Different types of tandem repeat units of SSRs in all SSRs 
p b nd 
SSR33 SSR32 SSR30 SSR20 SSR8 
图 6 AEREA SSR 位 点 鉴定 
Fig. 6 Identification of SSRs loci in Ascosphaera apis samples from two different regions in China 
CS: 浙江 苍山 样品 Samples from Cangshan, Zhejiang; FZ: 福建 福州 样品 Samples from Fuzhou, Fujian. 
表 8 SSRs 引物 序列 
Table 8 Primers used in SSR locus amplification 3 il it 
引物 名 称 引物 序列 (5' -3 ) 预期 片段 大 小 (bp) 

Primer name Primer sequence Expected fragment size 本 课题 组 前 期 已 对 球 喜 菌 胁迫 的 意 蜂 幼虫 和 中 
Uni8-F CCTCCAATGTACCATCACCC- m 蜂 幼 虫 进行 转 录 组 研究 ( 未 发 表 数 据 ) ， 为 了 揭示 球 
Uni8-R TGAGGGTTGTTGATGCGATA ES gh vg t " Y 二 ERN 
SUMA HONOR UM 宫 菌 胁迫 过 程 中 的 病原 -宿主 互 作 , a A ERIE A E 

nL ax 7U J. 了 了 a aX 

215 ITE A. E SATKGN RUE 2 
Uni20-R CAGGCTGCACTGGAGTATCA 行 转 录 组 学 研究 。 PAN GRE ul 的 e 组 早 在 006 
ZRA AN i M gd JN 

Uni30-F ^ TCCTCGATTTCGTAACCGTC - 年 就 已 公布 (Qin et al., 2006) ,但 当时 并 未 公布 基 
Uni30-R ^ TGTTCCAGAAATTGGGAAGG TELS BE EE E , TERA A E D] T BE EAE 
Uni32-F ^ TGCTGATGCTGATGAAGAGG - 进展 缓慢 。 本 研究 利用 RNA seq 技术 对 纯 培 养 的 
Uni32-R — GCAAGTGGCTGACATGAAGA PRIE AIER 3E pi a Ye hy tg 4] rb I a d p RE I 
UG  CGGTTACCGOGATCAATTAC — 序 ,之 所 以 同时 对 后 者 进行 测序 ,目的 是 尽 可 能 增 大 
Uni33-R AGCCTCGAACGAACGAATTA 


RNA seq i t , Pf te FERIE P 05 Te K H AS H 
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装 质量 。 本 研究 共 组 装 得 到 42 609 个 unigenes , 平 
均 长 度 为 966 nt, N50 达到 1 550 nt, 较 好 的 测序 质 
量 可 为 球 圳 菌 的 转录 组 学 研究 提供 可 靠 的 参考 信 
息 , 也 可 以 用 于 验证 球 早 菌 基 因 组 信息 。 通 过 比 对 
NCBI Nr, Swiss-Prot, KOG 数据 库 对 组 装 的 球 圳 菌 








本 课题 组 前 期 研究 中 基于 趋势 分 析 的 结果 表明 , 意 
蜂 幼 虫 肠 道 的 球面 菌 绝 大 多 数 差 异 表达 基因 
(DECs) 都 表现 出 上 升 趋势 ,而 中 蜂 幼 虫 肠 道 的 球 宫 
菌 有 相当 一 部 分 DEGs 表现 为 下 降 趋 势 (未 发 表 数 
据 ) ,推测 是 球 宫 菌 与 不 同 宿 主 互 作 的 结果 ,目前 正 

















参考 转录 组 进行 功能 注释 ,通过 比 对 KEGG 数据 库 
对 其 进行 代谢 通路 注释 ,有 功能 及 代谢 通路 注释 的 
unigenes 数目 为 29 316(68.8% ) ,这 些 注 释 将 为 后 
续 在 分 子 水 平 研究 球 吉 菌 提供 重要 的 参考 信息 。 此 
外 ,有 13 294(31. 19% ) 个 unigenes 没有 功能 注释 ， 
填补 这 些 空白 有 赖 于 上 述 公共 数据 库 信息 的 不 断 丰 
富 和 完善 。 本 研究 中 , 球 吉 菌 注释 基因 数 最 多 的 物 
种 是 法 夫 酵 母 , 后 者 的 分 子 研究 起 步 较 早 且 较 为 深 
A (Baeza et al., 2012; Alcaíno et al., 2014; 
Gutiérrez et al., 2015; Leiva et al., 2015) ,已 经 鉴定 
并 验证 功能 的 基因 信息 可 作为 参考 基因 在 球 喜 菌 中 
尝试 克隆 并 进行 功能 研究 。 

微 卫 星 标记 主要 应 用 于 基因 连锁 与 遗传 图 谱 构 
建 (Miyao et al., 1996) .谱系 及 发 育 研 究 (Nicolas ， 
1998) .遗传 多 样 性 研究 (Nori et al., 1999) 疾病 检 
测 (Hee et al., 2001) 及 品种 鉴定 (Michael and 
Guillermo, 2003) $t, H fij E IBS ERZE TRI ic E E ps 
记 很 少 。 本 研究 利用 MISA 软件 搜索 所 有 unigenes , 
共 得 到 7 968 个 SSR 位 点 ,随机 挑 取 20 对 引物 对 两 
个 来 源 的 球 宫 菌 样 品 中 进行 SSR 扩 增 ,有 5 对 引物 
能 够 扩 增 出 特异 性 片段 。 本 研究 中 ,SSR 位 点 扩 增 
产物 分 离 采 用 的 是 琼脂 糖 凝 胶 电 泳 ,此 法 被 部 分 
内 外 研究 所 采用 ( 辛 业 芸 等, 2005; Zhang et al., 
2013; 张 月 飞 等 , 2016) ,琼脂 糖 凝 胶 的 分 辨 率 低 于 
PAGE 胶 , 可 能 会 导致 杂 合体 不 能 有 效 分 离 。 但 是 ， 
SSRs 位 点 鉴定 可 视 为 对 组 装 的 球 吉 菌 参考 转录 组 
数据 信息 的 应 用 ,后 续 研 究 将 通过 PAGE 胶 电 泳 进 
一 步 分 离 SSRs 位 点 扩 增 产物 中 可 能 包含 的 杂 合体 。 
传统 的 微 卫星 标记 开发 方法 费时 耗 力 ,效率 低下 , 基 
于 RNA seq 数据 开发 微 卫星 标记 的 方法 快速 高 效 ， 
有 助 于 大 规模 开发 球面 菌 分 子 标记 ,推动 球 喜 戎 的 
菌株 鉴定 、 基 因 图 谱 构 建 以 及 基因 定位 等 研究 的 深 
入 开展 。 

白垩 病 是 养 蜂 生产 中 的 顽疾 , 尚 无 有 效 的 防治 
方法 。 球 时 菌 参 考 基因 组 和 转录 组 信息 的 缺失 导致 
严重 阻碍 该 病原 的 分 子 研 究 。 本 研究 成 功 组 装 球 客 
菌 的 参考 转录 组 ,并 对 其 进行 了 功能 与 代谢 通路 注 
释 , 将 为 球 宫 菌 的 转录 组 学 研究 提供 重要 的 参考 信 
息 ,为 在 分 子 水 平 深入 研究 球 蝇 菌 基因 奠定 基础 。 
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EXTERE DEGs 进行 深入 分 析 。 
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